11.05.2023

Химический хакатон, или как в Школе 619 помогают обучить нейросеть

11 мая в 9 утра в Школе 619 стартовала Стратегическая сессия «Генерация данных для инфохимического поисковика», которая проводится под эгидой Университета ИТМО.
В работе сессии принимают участие более 40 учеников старших классов Школы 619, а также студенты ИТМО Родион Головинский, Елена Щербакова, Илья Тонкий, Алина Лузанова, Иван Малышев.

Участникам сессии сегодня предстоит потрудиться над непростыми заданиями, а итоги этой работы сегодня вечером подведет кандидат химических наук, директор, ведущий профессор Научно-образовательного центра инфохимии ИТМО Екатерина Скорб. Перед учениками поставлена реальная задача – собрать данные для обучения нейросети, которая способна переводить изображения молекул в единый стандартный формат химических формул.

«Мероприятие проводится с целью укрепления сотрудничества с научно-образовательным центром Инфохимии Университета ИТМО и погружения учеников Школы 619 в научно-исследовательскую деятельность», - отметила организатор события, руководитель развития и продвижения образовательных проектов Школы 619 Ольга Сорокина.

О корне проблемы, над которой работают ребята, доступно и интересно рассказывает сайт colab.ws. «К сожалению, описания молекул из работ до компьютерной эры остались на бумаге в виде разномастных рисунков, - говорится в источнике. - Их слишком много, а потому обработка вручную займет неоправданно много времени. На помощь могут прийти технологии искусственного интеллекта.

Именно такую систему предложили сотрудники Сколковского института, ООО «Синтелли» и Научно-технического университета «Сириус». Она способна преобразовывать изображения органических молекул в SMILES-строку. Такой способ представления однозначно описывает даже циклическую молекулу как цепочку атомов с указанием типа связей и того, какие группы атомов к ней прикреплены.

Для обучения нейросети также был разработан генератор данных, который случайным образом моделирует различные стили рисования, функциональные группы и возможное художественное оформление, мешающее компьютеру выделить то, что необходимо. Представленная нейросеть может стать основой для быстрого и эффективного извлечения информации из рисунков молекул, что окажется полезным для пополнения общей базы химических структур».
Статья полностью - https://colab.ws/news/92

#Школа619 #наука619 #ИТМО #сотрудничество619

К списку новостей